Informe de Predicción de Ventas

1. Información del Dataset

Información General del Dataset

Total de registros: 541909

Total de columnas: 15

Memoria utilizada: 208.27 MB

# Columna No Nulos Tipo de Dato
0 InvoiceNo 541909 / 541909 object
1 StockCode 541909 / 541909 object
2 Description 540455 / 541909 object
3 Quantity 541909 / 541909 int64
4 InvoiceDate 541909 / 541909 datetime64[ns]
5 UnitPrice 541909 / 541909 float64
6 CustomerID 541909 / 541909 float64
7 Country 541909 / 541909 object
8 TotalVentas 541909 / 541909 float64
9 Year 541909 / 541909 int32
10 Month 541909 / 541909 int32
11 Quarter 541909 / 541909 int32
12 DayOfWeek 541909 / 541909 int32
13 Hour 541909 / 541909 int32
14 YearMonth 541909 / 541909 object

2. División del Dataset

División del Dataset

El dataset ha sido dividido en:

Se mantiene el orden temporal para evitar fuga de información.

3. Métricas de Modelos de Predicción

Métricas de Modelos de Predicción

ModeloMAERMSE
ARIMA24632.7229086.40
Regresión Lineal28453.7632578.18
Random Forest34275.4138779.61
Prophet 77749.40 80210.21
LSTM 30459.05 33871.77

4. Mejor Modelo

Mejor Modelo Seleccionado

El modelo más preciso basado en RMSE Test es:

ARIMA

Este modelo ha demostrado ser el más preciso para predecir ventas futuras.

5. Estadísticas Generales

Quantity UnitPrice CustomerID TotalVentas
count 541909.000000 541909.000000 406829.000000 541909.000000
mean 9.552250 4.611114 15287.690570 17.987795
std 218.081158 96.759853 1713.600303 378.810824
min -80995.000000 -11062.060000 12346.000000 -168469.600000
25% 1.000000 1.250000 13953.000000 3.400000
50% 3.000000 2.080000 15152.000000 9.750000
75% 10.000000 4.130000 16791.000000 17.400000
max 80995.000000 38970.000000 18287.000000 168469.600000

6. Gráficos Generados

Tendencia de Ventas

Distribución de Ventas

Mapa de Calor de Correlación

Boxplot de Ventas

Ventas por País

Distribución de Precios (Violín)

Distribución de Cantidades (Violín)

Comparación de Predicciones

Ventas por Día de la Semana

Tendencia de Ventas: Entrenamiento, Validación y Test

Treemap de Ventas por País

Flujo de Ventas por País y Cliente

Comparación de Modelos

Relación entre Cantidad y Ventas

Scatter 3D de Ventas

Modelo Predictivo

Mapa de calor - Transformación logarítmica

Distribución Variable Clave

Evolución de Ventas

Mapa de Ventas por País

Histograma de Compras por Cliente